OpenAI已宣布推迟发布备受期待的ChatGPT语音助手功能,以确保它能够安全有效地处理来自数百万用户的请求。
这家人工智能初创公司在5月份的产品发布会上为GPT-4o推出了语音选项,GPT-4o是GPT-4模型的更新版本,在实时处理文本、音频和图像方面做得更好。
OpenAI在一份声明中表示,该公司原本打算在6月底向一小部分付费ChatGPT plus用户推出语音功能,但后来认为还需要一个月的时间才能“达到我们的标准”。
“我们正在改进该模型检测和拒绝某些内容的能力,”该公司周二表示:“我们还在努力改善用户体验,并准备好我们的基础设施,以便在保持实时响应的同时扩展到数百万用户。”
有分析人士表示,对于OpenAI来说,这一推迟可能算是一个挫折,因为它一直努力在竞争日益激烈的AI领域保持领先地位。
周二,OpenAI还表示,该公司计划在秋季向所有付费用户推出语音功能,同时其也在努力发布视频和屏幕共享功能。该公司已在5月份的活动中展示了这些功能。
该公司表示,它将在未来让用户更多地了解这些功能的发布时间。
因此,当下个月部分付费用户可以使用语音功能时,它的功能可能会比在发布会上展示的更有限。例如,聊天机器人将无法使用计算机视觉功能,该功能可以让它通过使用智能手机的摄像头就用户的舞蹈动作提供语音反馈。
不过整体而言,新功能承诺将响应速度更快,并与强大的图像识别功能相结合,使聊天机器人成为一个更有用、更有活力的对话伙伴。在发布会上的舞台上,OpenAI的员工展示了ChatGPT几乎可以即时响应请求,比如解决研究人员在手机摄像头前的一张纸上写着的的数学问题。